我们提出了一种方法,通过将知识存储在外部知识图(kg)中,并使用密集的索引从该kg中检索,使自然语言理解模型更有效地有效。给定(可能是多语言的)下游任务数据,例如德语中的句子,我们从kg中检索实体,并使用其多模式表示形式来改善下游任务绩效。我们使用最近发布的VisualSem KG作为我们的外部知识存储库,涵盖了Wikipedia和WordNet实体的子集,并比较基于元组和基于图的算法的混合,以学习基于KG多模式信息的实体和关系表示。 。我们在两个下游任务上展示了学识渊博的实体表示形式的有用性,并在多语言命名实体识别任务上的性能提高了$ 0.3 \%$ - $ 0.7 \%\%$ f1,而我们的准确度最高为$ 2.5 \%\%$ $提高。在视觉意义上的歧义任务上。我们所有的代码和数据都提供:\ url {https://github.com/iacercalixto/visualsem-kg}。
translated by 谷歌翻译